智能论文笔记

Risk markers by sex for in-hospital mortality in patients with acute coronary syndrome: a machine learning approach

Blanca Vazquez , Gibran Fuentes-Pineda , Fabian Garcia , Gabriela Borrayo , Juan Prohias

分类：机器学习

2021-01-06

背景：几项研究突出了考虑急性冠状动脉综合征（ACS）诊断和治疗性差异的重要性。然而，几乎已经研究了ACS子群中的性别特异性风险标志物。本研究旨在探索机器学习（ML）模型，以识别从电子健康记录（EHR）的公共数据库中的ACS子群体中的妇女和男性的住院死亡率标志。方法：从医疗信息MART中提取1,299名患有的ST升高的心肌梗死（Stemi）和2,820名非St-Expation心肌梗死患者进行重症监护（MIMIC）-III数据库。我们培训和验证了死亡率预测模型，并使用了可解释性技术来识别每个子群体的性别特异性标记。结果：基于极端梯度升压的模型（XGBoost）实现了最高性能：STEMI和AUC = 0.94（95 \％CI：0.80- 0.90）为nstemi。对于STEMI，女性的顶部标记是慢性肾功能衰竭，心率高，年龄超过70岁。对于男性来说，顶部标记是急性肾功能衰竭，高肌钙蛋白T水平，年龄超过75岁。然而，对于NStemi，女性的顶部标记较低，肌钙蛋白水平低，尿素水平高，80多年。对于男性来说，顶部标记是高心率，肌酐水平，年龄超过70岁。结论：我们的结果表明，通过解释ehrs培训的ML死亡率模型，通过解释ML死亡率模型显示不同ACS子群的可能的显着和相干的性别特异性风险标记。在妇女与男性的确定风险标志中观察到差异，突出了考虑性别特异性标记在实施更适当的治疗策略和更好的临床结果方面的重要性。

translated by 谷歌翻译

3rd Continual Learning Workshop Challenge on Egocentric Category and Instance Level Object Understanding

Lorenzo Pellegrini , Chenchen Zhu , Fanyi Xiao , Zhicheng Yan , Antonio Carta , Matthias De Lange , Vincenzo Lomonaco , Roshan Sumbaly , Pau Rodriguez , David Vazquez

分类：计算机视觉 | 人工智能 | 机器学习

2022-12-13

Continual Learning, also known as Lifelong or Incremental Learning, has recently gained renewed interest among the Artificial Intelligence research community. Recent research efforts have quickly led to the design of novel algorithms able to reduce the impact of the catastrophic forgetting phenomenon in deep neural networks. Due to this surge of interest in the field, many competitions have been held in recent years, as they are an excellent opportunity to stimulate research in promising directions. This paper summarizes the ideas, design choices, rules, and results of the challenge held at the 3rd Continual Learning in Computer Vision (CLVision) Workshop at CVPR 2022. The focus of this competition is the complex continual object detection task, which is still underexplored in literature compared to classification tasks. The challenge is based on the challenge version of the novel EgoObjects dataset, a large-scale egocentric object dataset explicitly designed to benchmark continual learning algorithms for egocentric category-/instance-level object understanding, which covers more than 1k unique main objects and 250+ categories in around 100k video frames.

translated by 谷歌翻译

Democratizing Machine Translation with OPUS-MT

Jörg Tiedemann , Mikko Aulamo , Daria Bakshandaeva , Michele Boggia , Stig-Arne Grönroos , Tommi Nieminen , Alessandro Raganato , Yves Scherrer , Raul Vazquez , Sami Virpioja

分类：自然语言处理

2022-12-04

This paper presents the OPUS ecosystem with a focus on the development of open machine translation models and tools, and their integration into end-user applications, development platforms and professional workflows. We discuss our on-going mission of increasing language coverage and translation quality, and also describe on-going work on the development of modular translation models and speed-optimized compact solutions for real-time translation on regular desktops and small devices.

translated by 谷歌翻译

Flaky Performances when Pretraining on Relational Databases

Shengchao Liu , David Vazquez , Jian Tang , Pierre-André Noël

分类：机器学习

2022-11-09

We explore the downstream task performances for graph neural network (GNN) self-supervised learning (SSL) methods trained on subgraphs extracted from relational databases (RDBs). Intuitively, this joint use of SSL and GNNs should allow to leverage more of the available data, which could translate to better results. However, we found that naively porting contrastive SSL techniques can cause ``negative transfer'': linear evaluation on fixed representations from a pretrained model performs worse than on representations from the randomly-initialized model. Based on the conjecture that contrastive SSL conflicts with the message passing layers of the GNN, we propose InfoNode: a contrastive loss aiming to maximize the mutual information between a node's initial- and final-layer representation. The primary empirical results support our conjecture and the effectiveness of InfoNode.

translated by 谷歌翻译

Constraining Representations Yields Models That Know What They Don't Know

Joao Monteiro , Pau Rodriguez , Pierre-Andre Noel , Issam Laradji , David Vazquez

分类：机器学习 | 人工智能 | 计算机视觉

2022-08-30

神经网络的一种众所周知的故障模式对应于高置信度错误的预测，尤其是对于训练分布有所不同的数据。这种不安全的行为限制了其适用性。为此，我们表明可以通过在其内部表示中添加约束来定义提供准确置信度的模型。也就是说，我们将类标签编码为固定的唯一二进制向量或类代码，并使用这些标签来在整个模型中强制执行依赖类的激活模式。结果预测因子被称为总激活分类器（TAC），而TAC用作基础分类器的附加组件，以指示预测的可靠性。给定数据实例，TAC切片中间表示分为不相交集，并将此类切片减少到标量中，从而产生激活曲线。在培训期间，将激活轮廓推向分配给给定培训实例的代码。在测试时，可以预测与最匹配示例激活曲线的代码相对应的类。从经验上讲，我们观察到激活模式及其相应代码之间的相似之处导致一种廉价的无监督方法来诱导歧视性置信度得分。也就是说，我们表明TAC至少与从现有模型中提取的最新置信度得分一样好，同时严格改善了模型在拒绝设置上的价值。还观察到TAC在多种类型的架构和数据模式上都很好地工作。

translated by 谷歌翻译

Deep Computational Model for the Inference of Ventricular Activation Properties

Lei Li , Julia Camps , Abhirup Banerjee , Marcel Beetz , Blanca Rodriguez , Vicente Grau

分类：计算机视觉

2022-08-08

患者特异性的心脏计算模型对于使用数字双胞胎的精密医学和silico临床试验的有效实现至关重要。心脏数字双胞胎可以为个别患者提供心脏功能的非侵入性特征，因此对于患者特定的诊断和治疗分层有希望。然而，目前的解剖学和功能性孪生阶段的工作流，指的是模型解剖结构和临床数据的参数的推断，并不足够有效，稳健且准确。在这项工作中，我们提出了一个基于深度学习的特定于患者的计算模型，该模型可以融合解剖学和电生理信息，以推理心室激活特性，即传导速度和根节点。激活特性可以提供对心脏电生理功能的定量评估，以指导介入。我们采用Eikonal模型来生成具有地面真实特性的模拟心电图（ECG），以训练推理模型，在此还考虑了特定的患者信息。为了进行评估，我们在模拟数据上测试模型，并以快速的计算时间获得通常有希望的结果。

translated by 谷歌翻译

Identity Testing for High-Dimensional Distributions via Entropy Tensorization

Antonio Blanca , Zongchen Chen , Daniel Štefankovič , Eric Vigoda

分类：机器学习

2022-07-19

我们提出了改进的算法，并为身份测试$ n $维分布的问题提供了统计和计算下限。在身份测试问题中，我们将作为输入作为显式分发$ \ mu $，$ \ varepsilon> 0 $，并访问对隐藏分布$ \ pi $的采样甲骨文。目标是区分两个分布$ \ mu $和$ \ pi $是相同的还是至少$ \ varepsilon $ -far分开。当仅从隐藏分布$ \ pi $中访问完整样本时，众所周知，可能需要许多样本，因此以前的作品已经研究了身份测试，并额外访问了各种有条件采样牙齿。我们在这里考虑一个明显弱的条件采样甲骨文，称为坐标Oracle，并在此新模型中提供了身份测试问题的相当完整的计算和统计表征。我们证明，如果一个称为熵的分析属性为可见分布$ \ mu $保留，那么对于任何使用$ \ tilde {o}（n/\ tilde {o}），有一个有效的身份测试算法Varepsilon）$查询坐标Oracle。熵的近似张力是一种经典的工具，用于证明马尔可夫链的最佳混合时间边界用于高维分布，并且最近通过光谱独立性为许多分布族建立了最佳的混合时间。我们将算法结果与匹配的$ \ omega（n/\ varepsilon）$统计下键进行匹配的算法结果补充，以供坐标Oracle下的查询数量。我们还证明了一个计算相变：对于$ \ {+1，-1，-1 \}^n $以上的稀疏抗抗铁磁性模型，在熵失败的近似张力失败的状态下，除非RP = np，否则没有有效的身份测试算法。

translated by 谷歌翻译

Bayesian multi-objective optimization for stochastic simulators: an extension of the Pareto Active Learning method

Bruno Barracosa , Julien Bect , Héloïse Dutrieux Baraffe , Juliette Morin , Josselin Fournel , Emmanuel Vazquez

分类： (统计)机器学习

2022-07-08

本文重点介绍了具有高输出方差的随机模拟器的多目标优化，其中输入空间是有限的，并且目标函数的评估昂贵。我们依靠贝叶斯优化算法，这些算法使用概率模型来对要优化的功能进行预测。所提出的方法是用于估计帕累托最佳溶液的帕累托主动学习（PAL）算法的扩展，该算法使其适合随机环境。我们将其命名为随机模拟器（PAL）的Pareto主动学习。通过数值实验对一组双维，双目标测试问题进行数值实验评估了PAL的表现。与其他基于标量的和随机搜索的方法相比，PAL表现出卓越的性能。

translated by 谷歌翻译

FetReg2021: A Challenge on Placental Vessel Segmentation and Registration in Fetoscopy

Sophia Bano , Alessandro Casella , Francisco Vasconcelos , Abdul Qayyum , Abdesslam Benzinou , Moona Mazher , Fabrice Meriaudeau , Chiara Lena , Ilaria Anita Cintorrino , Gaia Romana De Paolis

分类：人工智能 | 计算机视觉 | 机器学习

2022-06-24

胎儿镜检查激光光凝是一种广泛采用的方法，用于治疗双胞胎输血综合征（TTTS）。该过程涉及光凝病理吻合术以调节双胞胎之间的血液交换。由于观点有限，胎儿镜的可操作性差，可见性差和照明的可变性，因此该程序尤其具有挑战性。这些挑战可能导致手术时间增加和消融不完全。计算机辅助干预措施（CAI）可以通过识别场景中的关键结构并通过视频马赛克来扩展胎儿镜观景领域，从而为外科医生提供决策支持和背景意识。由于缺乏设计，开发和测试CAI算法的高质量数据，该领域的研究受到了阻碍。通过作为MICCAI2021内窥镜视觉挑战组织的胎儿镜胎盘胎盘分割和注册（FETREG2021）挑战，我们发布了第一个Largescale Multencentre TTTS数据集，用于开发广义和可靠的语义分割和视频摩擦质量algorithms。对于这一挑战，我们发布了一个2060张图像的数据集，该数据集是从18个体内TTTS胎儿镜检查程序和18个简短视频剪辑的船只，工具，胎儿和背景类别的像素通道。七个团队参与了这一挑战，他们的模型性能在一个看不见的测试数据集中评估了658个从6个胎儿镜程序和6个短剪辑的图像的图像。这项挑战为创建通用解决方案提供了用于胎儿镜面场景的理解和摩西式解决方案的机会。在本文中，我们介绍了FETREG2021挑战的发现，以及报告TTTS胎儿镜检查中CAI的详细文献综述。通过这一挑战，它的分析和多中心胎儿镜数据的发布，我们为该领域的未来研究提供了基准。

translated by 谷歌翻译

Relaxed Gaussian process interpolation: a goal-oriented approach to Bayesian optimization

Sébastien Petit , Julien Bect , Emmanuel Vazquez

分类： (统计)机器学习

2022-06-07

这项工作提出了一个新的程序，可以在高斯过程（GP）建模的背景下获得预测分布，并放松了一些感兴趣的范围之外的插值约束：预测分布的平均值不一定会在观察到的值时插入观察值的值。感兴趣的外部范围，但仅限于留在外面。这种称为放松的高斯工艺（REGP）插值的方法在感兴趣的范围内提供了更好的预测分布，尤其是在GP模型的平稳性假设不合适的情况下。它可以被视为一种面向目标的方法，并且在贝叶斯优化中变得特别有趣，例如，对于目标函数的最小化，低功能值的良好预测分布很重要。当将预期改进标准和REGP用于依次选择评估点时，从理论上保证了所得优化算法的收敛性（前提）。实验表明，在贝叶斯优化中使用REGP代替固定的GP模型是有益的。

translated by 谷歌翻译